Otimização Convexa: Fundamentos Geométricos da Otimização Convexa

Imagine navegar por um terreno complexo onde seu objetivo é encontrar o ponto mais próximo de segurança. Na linguagem da otimização, essa 'segurança' é um conjunto $C$, e a ação de encontrar o ponto mais próximo é uma projeção. Embora a intuição sugira que sempre existe um único ponto 'mais próximo', a realidade matemática é mais sutil. A base geométrica da otimização convexa repousa na formalização da 'proximidade', indo além da intuição euclidiana para representações funcionais rigorosas como as funções indicadora e de suporte.

1. Projeções e Distâncias

A distância de um ponto $x_0$ a um conjunto $C$ é definida como o infimum de todas as distâncias possíveis a pontos dentro do conjunto:

$\text{dist}(x_0, C) = \inf\{\|x_0 - x\| \mid x \in C\}$

O otimizador específico que alcança esta distância é o operador de projeção:

$P_C(x_0) = \text{argmin}\{\|x - x_0\| \mid x \in C\}$

Para um hiperplano simples definido por $a^T x = b$, a projeção tem uma solução fechada elegante: $P_C(x_0) = x_0 + (b - a^T x_0)a/\|a\|_2^2$. No entanto, para conjuntos gerais, este problema permanece como uma otimização restrita: minimize $\|x - x_0\|$ sujeito a $f_i(x) \leq 0$ e $Ax = b$.

2. Geometria Funcional

Para tratar restrições geométricas como componentes objetivos, empregamos dois poderosos 'espelhos' funcionais:

A Função Indicadora $I_C(x)$: $I_C(x) = \begin{cases} 0 & x \in C \\ +\infty & x \notin C \end{cases}$. Isso colapsa a geometria em uma penalidade numérica.
A Função de Suporte $S_C(x)$: $S_C(x) = \sup_{y \in C} x^T y$. Isso caracteriza o conjunto por seus hiperplanos limitantes em todas as direções.

Teorema: Teorema de Motzkin

Um conjunto não vazio e fechado $C \in \mathbf{R}^n$ é um conjunto de Chebyshev (com uma projeção única para cada $x_0$) se e somente se for convexo.

Esboço da Prova (Unicidade)

Suponha que $C$ seja convexo e que a norma seja estritamente convexa. Se houvesse dois pontos distintos mais próximos $u, v \in C$ com $\|u - x_0\| = \|v - x_0\| = d$, então seu ponto médio $w = (u+v)/2$ estaria em $C$ (por convexidade).

Pela convexidade estrita da norma: $\|w - x_0\| = \|\frac{1}{2}(u - x_0) + \frac{1}{2}(v - x_0)\| < \frac{1}{2}\|u - x_0\| + \frac{1}{2}\|v - x_0\| = d$.

Isso contradiz a suposição de que $d$ era a distância mínima. Assim, a projeção deve ser única.

Aviso 8.4: Dependência da Norma

Muitas vezes construímos um hiperplano separador usando: $(P_C(x_0) - x_0)^T (x - (1/2)(x_0 + P_C(x_0))) = 0$. Cuidado! Esta construção específica é válida apenas para a norma euclidiana. Normas gerais exigem tratamentos mais sutis da ortogonalidade.

🎯 Ideia Central

A convexidade é o 'cola' que garante a estabilidade na otimização geométrica. Sem ela, até mesmo a tarefa simples de 'encontrar o ponto mais próximo' pode resultar em soluções múltiplas e conflitantes, levando à instabilidade algorítmica.

PERGUNTA 1

De acordo com o Teorema de Motzkin, quais são as condições necessárias e suficientes para um conjunto não vazio e fechado em Rⁿ ser um conjunto de Chebyshev?

Ele deve ser limitado e aberto.

Ele deve ser convexo.

Ele deve conter a origem.

Ele deve ser um subespaço.

PERGUNTA 2

Qual é a solução em forma fechada para projetar um ponto x₀ no hiperplano aᵀx = b no espaço euclidiano?

P_C(x₀) = x₀ + (b - aᵀx₀)a / ||a||₂²

P_C(x₀) = x₀ - (b + aᵀx₀)a / ||a||₂

P_C(x₀) = (b / aᵀx₀)a

P_C(x₀) = x₀ + aᵀx₀ / b

PERGUNTA 3

Por que uma projeção sobre o conjunto de matrizes de posto k (Exemplo 8.2) potencialmente carece de unicidade?

O conjunto não é convexo.

O conjunto não é fechado.

O posto é sempre uma propriedade linear.

Matrizes não têm normas.

PERGUNTA 4

Qual função permite representar um conjunto C como uma penalidade em uma função objetivo, retornando 0 se o ponto está no conjunto e ∞ caso contrário?

A Função de Suporte S_C(x)

A Função Indicadora I_C(x)

A Função de Distância dist(x, C)

A Matriz de Gram

PERGUNTA 5

Verdadeiro ou Falso: a construção de um hiperplano separador usando o ponto médio entre x₀ e sua projeção funciona para qualquer norma.

Verdadeiro

Falso